資料探勘演算法 - 分類法 - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2017 iT 邦幫忙鐵人賽

DAY 22

Big Data

從學生到職場：菜鳥資料科學家的第一個月系列第 22 篇

資料探勘演算法 - 分類法

2017鐵人賽

WeiYuan

2016-12-24 20:00:25

8893 瀏覽

分享至

分類法

分類法（Classification）是資料探勘與機器學習中重要的算法。分類主要是用來將資料做區分，判斷資料是屬於哪一個類別。從原有的已知類別的資料集進行學習，用來判斷新進的未知類別資料。因為是已知類別的資料集進行學習所以也被稱為監督式學習（Supervised Learning）。

分類法可以分為兩種用法：分析與預測。

分析：用來解釋其模型形成的原因，能夠瞭解資料本身的特性及應用。
預測：根據資料的特徵及模型可以幫助預測未來新的資料走向。

分類法用在各式各樣的領域中，像是銀行用來判斷給不給貸款，醫生用來判斷是否有患病，等等。

基本概念

一般會將原本已知類別的資料集稱為訓練資料集（Traing Data），因為我們想從這些資料中學習，訓練出規則。

會進一步再把已知類別的資料分為訓練資料（Traing Data）與測試資料（Testing Data）。先把留一部分做為測試，用來檢驗訓練模型的好壞。

演算法

一般常用的演算法有以下幾種：決策樹、kNN 分類、貝氏分類法、羅吉斯回歸、SVM、類神經網路、類神經網路等等。之後再討論機器學習的時候再把演算法的部分補充。

Reference

資料探勘演算法 - 關聯規則

資料探勘演算法 - 分群法

系列文

從學生到職場：菜鳥資料科學家的第一個月共 28 篇

RSS系列文訂閱系列文

89 人訂閱

完整目錄

直播研討會

{{ item.channelVendor }} {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

參賽組數

1064 組

團體組數

40 組

累計文章數

22205 篇

完賽人數

602 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# windows server linux css react vue.js

IT邦幫忙

從學生到職場：菜鳥資料科學家的第一個月系列 第 22 篇

資料探勘演算法 - 分類法

分類法

基本概念

演算法

Reference

尚未有邦友留言

標記使用者

從學生到職場：菜鳥資料科學家的第一個月系列第 22 篇